روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات
نویسندگان
چکیده
: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. در این مقاله، یک ایده جدید برای استفاده مؤثّر از هر دو الگوریتم یادگیری فوق ارائه می شود. یک کنترلگر فازی سوگنو مرتبه صفر با تعدادی عمل کاندید برای هر قاعده جهت تولید فرمان های کنترل ربات در نظر گرفته شده است. هدف از آموزش تعیین عمل مناسب برای هر قاعده است. روش ترکیبی پیشنهاد شده دو مرحله دارد. در مرحله اول، داده آموزشی با حرکت ربات توسط ناظر در محیط جمع آوری می شود. سپس با بهره گیری از روش جدید ارائه شده، پارامترهای ارزش هر عمل کاندید در قواعد فازی با کمک داده های آموزشی مقدار دهی اولیه می شوند. در مرحله دوم از الگوریتم سارسای فازی برای تنظیم دقیق تر پارامترهای تالی کنترلگر بصورت برخط استفاده می شود. نتایج شبیه سازی در شبیه ساز kiks برای ربات خپرا حاکی از بهبود قابل توجه در زمان یادگیری، تعداد شکست ها، و کیفیت حرکت ربات می باشد.
منابع مشابه
ترکیب یادگیری تقویتی پیوسته و یادگیری باناظر برای ناوبری ربات
استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّ...
15 صفحه اولاستخراج ویژگی از دادههای عمق با استفاده از روش یادگیری عمیق برای کنترلِ باناظر ربات چرخدار
این مقاله چارچوبی از یادگیری عمیقِ با ناظر را جهت ناوبری ربات چرخدار در زمینهای هموار با محوریت وظایف پیگیری دیوار و اجتناب از موانع ارائه مینماید. در اینجا، فرض بر این است که ربات تنها به یک سیستم بینایی (دوربین کینکت) مجهز است. چالش اصلی در هنگام استفاده از تصاویر عمق، ابعاد بالای تصاویر و استخراج ویژگیهای مناسب از آنها با هدف کاهش ابعاد ورودی کنترلگر میباشد. برای این منظور در این مقاله...
متن کاملیادگیری تقویتی برای ربات های فوتبالیست
مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...
ارائه روشی نوین مبتنی بر یادگیری تقویتی برای تعیین ساختار در شناسایی سیستم ها
ساختارها و مدل های دارای دینامیک متغیر و نحوه تعیین ساختار آنها به خصوص در حالت برخط طی سال های اخیر به منظور توسعه و بهبود روش های شناسایی سیستم ها مورد توجه قرار گرفته اند. در این پایان نامه روشی نوین مبتنی بر الگوریتم های انتخاب عمل و پاداش دهی در یادگیری تقویتی برای تعیین ساختار در شناسایی سیستم ها ارائه شده است. قابلیت تعیین ساختار به صورت افزایشی یکی از ویژگی های بارز الگوریتم ارائه شده ا...
روشی جدید برای محاسبهی ناحیهی پایداری ربات انساننما
مهمترین نکته در راه رفتن رباتهای انساننما، حفظ تعادل است. مطالعات گستردهیی که تاکنون در این زمینه صورت گرفته به ارائهی نظریههای مرکز جرم(COG) و نقطهی صفر گشتاوری (ZMP)انجامیده است. تعادل ربات اساساً مبتنیبر قرارگیری این نقاط در ناحیهیی موسوم به ناحیهی پایداری است. در این پژوهش روشی جدید برای به دست آوردن ناحیهی پایداری ارائه شده است. بدینمنظور ابتدا بهکمک معادلات تعادل حاکم بر ر...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
کنترلجلد ۶، شماره ۳، صفحات ۱-۱۰
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023